ルビを取る処理の習得記録 Part 1「テキストファイルを開く」~「公式ドキュメントを見に行く」
青空文庫のルビを取るテキスト処理を習得してみよう 1.テキストファイルを開くとこから公式ドキュメントを見に行くまで
1. VS Codeで開いてみよう
https://gyazo.com/e3897cfeae7e41400b47d444bf670502
へへ……知ってるぜ、エンコードってやつだろう?(機構をよくしらない)
オーケー、見えるようになった。次!
/icons/fastparrot.iconMijinko_SD.icon
/emoji/ultra fast parrot.icontakker.icon
↑wwwwwwwcFQ2f7LRuLYP.icon
/icons/exceptionallyfastparrot.iconMijinko_SD.icon
さらに上があった……だと……!takker.icon
/emoji/slow parrot.icontakker.icon
/icons/slowparrot.iconMijinko_SD.icon
2. テスト用ファイルを作った
https://gyazo.com/e335e87fb9c92150aa990388cd02ea44
code:text
歌の話
折口信夫
[#6字下げ]歌《うた》の話《はなし》について[#「歌の話について」は中見出し]
これでもやりすぎか
https://gyazo.com/cc0aa79475ebe044481ad4efe8ac539f
code:text
歌の話
折口信夫
歌《うた》の話《はなし》について
駄目だ……もっとハードルを低くしなきゃ……
https://gyazo.com/6afabb6c150a597a5b1391c8415c4780
code:text
歌《うた》
ヨシ!.icon
おおー!!!!Mijinko_SD.icontakker.icon
3. どうやってスクリプトを書くんだっけ
そもそも動作環境をどうにかする必要があるような……
VSCodeはある
右下の言語モードでRubyを選べばよいはず
存在は知っているcFQ2f7LRuLYP.icon
Rubyのプロンプト上でカレントディレクトリから目標のディレクトリに移動するまで苦戦した記憶がある (戦いの記憶)
ブラウザ上でも実行できるみたいtakker.icon
このページにコードを書いて、↑のサイトで実行するほうがスムーズかも?
少なくとも、動作環境の不具合に悩まされる手間を省ける
ひ~助かりますcFQ2f7LRuLYP.icon
Scrapbox上にスクリプトを書いて実行することもできる suto3.icon
こんなことができるんですね…!cFQ2f7LRuLYP.icon
https://gyazo.com/4607736b38f9bffd43aa19d3bad3e074
エンコードの問題??
エンコードの問題(UTF-8でないとこうなる)suto3.icon コードの再利用ができたり
単体ページを作って、そこに残すようにしますcFQ2f7LRuLYP.icon
ええい知らん。デスクトップにファイルを直置きだ!
https://gyazo.com/6799bbf8742d350d004dc332850b3500ヨシ!.icon
script.arbとかいうこの上なくどうしようもない名前←そんなことはなかった
これを…………プロンプトかなんかで………………うごかすんだよな…………
scrapboxもscript.jsがよく使われるしへーきへーきtakker.icon
僕はいつもt.pyって名前にしてるwnishio.icon
参考になります~cFQ2f7LRuLYP.icon
プログラマーの最初の関門Mijinko_SD.icon
このscript.arbになにかを書き込めばいいはず
なにかとは?処理だよ
処理は今回は単純で、…………いや単純ではないな
下二つを探知?して""に置き換えることができればよさそう
1. ルビは《 》で囲まれている
2. 入力者の注は[# ]で囲まれている
この「探知する」という動作をRubyさんにお願いしなきゃならんわけだ
探知とは一体……?
公式ドキュメント!
せっかくなので生まれてはじめて流す
https://www.youtube.com/watch?v=MDZSdjLqiGA
これ↓を思い出したshoya140.icon
https://gyazo.com/ebad4b2feb21ee00e11836cc11bbbd49
太陽系マップ「組み込みライブラリ」の中に惑星「文字列のクラス」と「正規表現のクラス」がある、どちらかの惑星に着陸して探索するのが次のミッションだなwnishio.icon
一文字ずつ読んでいく路線と正規表現を使う路線があり、正規表現を使っても内部で一文字ずつ読んでいくので本質的には同じnishio.icon
「正規表現」という文字列操作に特化した「表現」(機能制限されたプログラミング言語のようなもの)を使って記述するスタイル